商湯發佈悟能具身智能平台 AI實現物理世界自我進化
商湯科技星期日(7月27日)在其承辦的「大愛無疆‧模塑未來」WAIC 2025大模型論壇上,正式發佈「悟能」具身智能平台。該平台以「開悟」世界模型為核心引擎,結合商湯在視覺感知、大裝置及日日新大模型等領域的技術積累,並依託商湯大裝置提供的端側與雲側算力支援,為機器人、智能設備賦予強大的感知、視覺導航及多模態交互能力,推動智能終端向更高層次的自主化與智能化演進。 商湯科技董事長兼首席執行官徐立表示:「世界模型和具身 AI的結合,將開啟 AI發展的下一個階段,完成由『工具』向『人』的躍遷,加速邁向 AGI時代。商湯希望『悟能』具身智能平台能夠幫助各類具身智能企業,幫助他們完成和現實世界交互的夢想。」 感知、導航和交互作為具身智能的三大核心能力,「悟能」平台在這三方面均展現出深厚實力,並將其轉化為「三大核心引擎」,可廣泛適配汽車、機器人等各類終端,實現空間層面的現實世界互動。 在感知方面,憑藉商湯方舟在視覺AI領域十餘年的深耕,「悟能」平台能為機器狗、機器人等各類終端硬體賦予萬物識別與理解能力,具備強大場景適配性,可完全嵌入端側晶片實現端側推理,提升感知效率與回應敏捷度。無論是機器狗還是機器人的視角,均能對外界形成整體天然感知識別,並對物體進行自然劃分切割。 導航方面,依託商湯絕影在純視覺端到端智能輔助駕駛方案的技術積累,「悟能」可泛化適配至機器人、機器狗等設備,確保其在多樣環境中實現精準路徑規劃與導航,並準確進行自動避障,無論是綠化小路中行動的小型機器狗,還是城區車道行駛的自動駕駛車輛均能如此。 交互能力上,基於「日日新」大模型的技術積累與反覆運算,「悟能」平台賦能機器人具備與現實世界交互的能力,呈現出有溫度、有深度、長記憶、超穩定等亮點。例如,由其賦能的人形機器人,能以風趣幽默、嚴謹務實等多種語言風格,生動講解AI生成的《長安的荔枝》電影介紹PPT。 「開悟」世界模型作為「悟能」平台的核心,憑藉強大的多模態深度理解能力,具備合理的空間與時間一致性,可生成高品質數據,有效提升具身智能終端設備的智能水平。該模型僅憑自然語言描述,就能生成逼真的七路攝像頭視角模擬數據,且不同視角的幾何位置高度對應,完全符合物理世界規律。 此外,「開悟」世界模型還能編輯真實世界,對現實場景中的車輛等元素進行替換、刪除、增補,創造更多樣的現實場景。基於這些生成和編輯能力,模型可精準模擬方向盤、刹車和油門控制,帶來如在真實街道場景中玩「極品飛車」般的效果,助力機器在現實世界中自由探索。 相較於智能汽車,機器人適用場景更廣泛,能通過主動探索生成更多高品質現實世界數據。在當前具身智慧數據匱乏的環境下,「悟能」平台通過構建面向人、物、場的4D真實世界,有望突破模型泛化能力邊界。未來,商湯科技將持續助力具身智能企業實現感知、理解與生成能力的躍進,將具身交互的不確定性挑戰轉化為產業升級的確定性路徑,推動AI向下一個十年加速進化。